查看原文
其他

浅谈全基因组复制

生信阿拉丁 生信阿拉丁 2022-05-16




浅谈全基因组复制


-01-

什么是全基因组复制

多倍化(polyploidy)或全基因加倍/复制(whole genome duplication, WGD)事件是指基因组内的所有序列都发生重复,重复为生物进化提供了原始的遗传材料,使植物基因组快速重组,丢失大量基因,增加结构变异,对植物进化极其重要。


-02-

为什么研究全基因组复制

多倍体植物广泛存在于自然界中,如日常生活中的马铃薯、小麦、棉花等。多倍化事件或全基因组复制事件直接将染色体进行加倍,被认为是一种物种分化的驱动力。研究发现多倍化在有花植物进化过程中十分频繁,在现存的被子植物和种子植物分化之前,都分别发生过加倍事件,可能对花和种子的产生有重要贡献 (Jiao et al., 2011)。基因组加倍为物种提供了丰盛的演化材料(图1)。被认为是提升了物种多样性、环境适应能力等(Jiao, 2018)。多倍化后的物种需要在原植物多倍化的研究对于生物进化、物种保护及遗传育种等方面都具有重要的理论指导意义及实践应用价值。


图1 全基因组复制事件的意义


-03-

如何鉴定全基因组复制

鉴定全基因组复制的方法一般可以通过以下三种:

  • 共线性块推断WGD的有无及其倍性;

  • Ks和4DTv分布图推断WGD事件及发生时间;

  • 基于共线性基因的溯祖树/物种树推断WGD是否共享

下面我们就前两种方式进行重点介绍。


-04-

基于共线性推断全基因组加倍

基因组共线性是基因组加倍比较直接的证据,通过比较两个基因组的序列并将共线性的区域作图展示,可以直观发现全基因组加倍的痕迹,如图2(左)苹果基因组(Daccord et al., 2017)的circos图中,可以明显染色体间大片段的共线性,表明该物种近期发生了全基因组复制。在向日葵基因组(Badouin et al., 2017)中,通过基因组自身的比对展示如图2(右),对角线为物种自身的基因和其本身的共线性。其余的点为基因组其他位置的旁系同源基因对。图中红色圆圈标注的位置,表明这两段之间具有一定的共性,为基因组加倍事件留下的痕迹。


图2 基于共线性推断基因组加倍事件

如果物种经历过多次全基因组加倍事件,近期的加倍事件会加速早期加倍事件的基因丢失,早期的加倍事件痕迹往往越来越不明显,共线性直观上不明显,这就需要我们探索其他方式来挖掘加倍事件,这就用到了4DTv和Ks的信息。下面我们对这两种方式来进行简单的介绍。             


-05-

为什么4DTv和Ks能够反映全基因组复制

同义突变指突变并不影响氨基酸序列,进而不会影响蛋白结构与功能。一般认为,同义突变不受自然选择,同义突变率(Ks)的计算为同义突变SNP数/同义位点数。由于同义位点突变不会引起氨基酸的变化,可以认为对编码蛋白没有影响,那么密码子同义位点的变化是完全随机的,并随时间推移累积。如果物种发生了全基因组加倍事件,现有基因组中会有一定数量的基因保留下来,这些基因在进化过程中累积的同义突变接近,计算得到的Ks值也接近,在某一个Ks值处会形成一个峰(ks peak)。如果这处Ks值的基因数目足够多,就会形成比较间的峰值,可以认为在进化过程中该处发生过全基因组加倍事件。全基因组加倍发生的时间越久远,基因丢失越多,发生的变化也要越大,形成的Ks峰越扁平,影响对全基因组加倍事件的判断。

4DTv与Ks有异曲同工之处(Tang et al., 2008),如果密码子的某个位点上任何核苷酸的改变都不影响其都编码的氨基酸,则称这个位点为4倍简并位点(fourfold degenerate site)是指共线性区段所包含的基因对的4DTV值可反映物种在进化史中的物种相对分化事件以及全基因组复制事件。4DTV指4D位点上发生颠换(嘌呤突变为嘧啶或者嘧啶突变为嘌呤)的位点所占的比例。


-06-

全基因组复制4DTv和Ks结果解读

以辣椒基因组文章中的4DTv和罂粟基因组文章中的Ks结果为例,解析全基因组复制事件。在辣椒基因组(Qin et al., 2014)文章中(如图3),选取了辣椒(pepper)、葡萄(grape)、土豆(potato)、番茄(tomato)进行4DTv分析。结果如下图。从图中可以看出在辣椒和葡萄分后(黄色线,4DTv值0.5处),茄科植物辣椒、土豆和番茄在分化之前共同发生了全基因组复制(图中指示WGD位置,黑线、蓝线和红线在4DTv值0.3处的峰值),之后辣椒和番茄分开(图中绿线,4DTv值0.1处)。关于4DTv如何推断全基因组加倍时间,文章中也给出了建议:在4DTv值0.48和0.1处分别为辣椒和葡萄、辣椒和番茄的物种分化时间,对应的时间点为∼89和20Mya,辣椒、番茄和土豆共有的全基因组加倍事件在4DTv值约0.3处,基于此可以大致推断该全基因组复制事件发生的时间约在55Mya。


图3 辣椒基因组进化树及4DTv峰图展示

在罂粟基因组文章(Guo et al., 2018)中,选取了罂粟(opium poppy)、耧斗菜(Aquilegia coerulea)、莲(otus)、葡萄(grape)、拟南芥(Arabidopsis)进行Ks分析,结果如图4,从Ks峰图和进化树可以看出,葡萄和罂粟在Ks值约1.6处(黄线)分开,葡萄在Ks值约1.4处(绿线)发生了核心双子叶植物共有的全基因组三倍化事件,耧斗菜在Ks值约1.0-1.2处发生了单独的全基因组复制,由于复制时间比较久远,所以峰较为扁平,莲在Ks值约0.5处发生了单独的全基因组复制事件,罂粟在Ks值约0.1处发生了全基因组复制,这是一个较为近期的全基因组复制事件。通过公式T=Ks/2r可以计算全基因组加倍事件发生的时间,r为核苷酸替代率,在文章中使用了6.98 × 10-9,计算得到的加倍时间在7.8百万年前。


图4 罂粟基因组进化树及Ks峰图展示


-07-

鉴定全基因组复制后还能做些什么

全基因组加倍后的复制基因的命运各有不同,其保留与丢失是否有偏向性?哪些基因倾向于保留,保留基因功能是否发生变化?保留的重复基因及其对调控网络进化的影响?基因组加倍在被子植物的适应性进化中发挥的作用,如何帮助植物适应剧烈环境变化等(Wu et al., 2020),这些都是全基因组复制后续可以挖掘的内容,在此不做过多介绍。

请继续关注我们哦~~


参考文献

Badouin, H., Gouzy, J., Grassa, C.J., Murat, F., Staton, S.E., Cottret, L., Lelandais-Briere, C., Owens, G.L., Carrere, S., Mayjonade, B., et al. (2017). The sunflower genome provides insights into oil metabolism, flowering and Asterid evolution. Nature 546, 148-152.

Daccord, N., Celton, J.M., Linsmith, G., Becker, C., Choisne, N., Schijlen, E., van de Geest, H., Bianco, L., Micheletti, D., Velasco, R., et al. (2017). High-quality de novo assembly of the apple genome and methylome dynamics of early fruit development. Nat Genet 49, 1099-1106.

Guo, L., Winzer, T., Yang, X., Li, Y., Ning, Z., He, Z., Teodor, R., Lu, Y., Bowser, T.A., Graham, I.A., et al. (2018). The opium poppy genome and morphinan production. Science 362, 343-347.Jiao, Y. (2018). Double the Genome, Double the Fun: Genome Duplications in Angiosperms. Mol Plant 11, 357-358.

Jiao, Y., Wickett, N.J., Ayyampalayam, S., Chanderbali, A.S., Landherr, L., Ralph, P.E., Tomsho, L.P., Hu, Y., Liang, H., Soltis, P.S., et al. (2011). Ancestral polyploidy in seed plants and angiosperms. Nature 473, 97-100.

Qin, C., Yu, C., Shen, Y., Fang, X., Chen, L., Min, J., Cheng, J., Zhao, S., Xu, M., Luo, Y., et al. (2014). Whole-genome sequencing of cultivated and wild peppers provides insights into Capsicum domestication and specialization. Proc Natl Acad Sci U S A 111, 5135-5140.

Tang, H., Wang, X., Bowers, J.E., Ming, R., Alam, M., and Paterson, A.H. (2008). Unraveling ancient hexaploidy through multiply-aligned angiosperm gene maps. Genome Res 18, 1944-1954.

Wu, S., Han, B., and Jiao, Y. (2020). Genetic Contribution of Paleopolyploidy to Adaptive Evolution in Angiosperms. Mol Plant 13, 59-71.


作者:May

审稿:童蒙

编辑:amethyst


往期回顾

全长转录本结构分析(下)

配对差异分析与非配对差异分析的区别

Pacbio文库如何加上barcode

如何NCBI上传Genbank数据

单体型组装入门介绍

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存